Programación de procesadores masivamente paralelos: Un enfoque práctico: El origen del cómputo con GPU

El nacimiento de la GPU fue un cambio radical impulsado por el "imperativo en tiempo real": la exigencia ineludible de renderizar escenas 3D complejas dentro de una ventana de $1/60^{th}$ de segundo (16,67 ms). Mientras que los CPUs siguieron una trayectoria multicore optimizada para ejecución serial de baja latencia, se encontraron con un límite a medida que aumentaban las resoluciones.

1. La restricción de 16,67 ms

A mediados de los años 90, los videojuegos llegaron a una crisis. Una CPU serial, encargada de la inteligencia artificial y la física, no podía calcular millones de valores de píxeles lo suficientemente rápido como para mantener un movimiento fluido. Esto obligó a crear hardware dedicado para desahogar la repetitiva pipeline gráfico.

2. Interleaving de líneas de barrido (SLI)

Antes de los arreglos paralelos internos, 3dfx introdujo Interleaving de líneas de barrido (SLI). Al utilizar dos tarjetas físicas para calcular líneas horizontales alternas, la industria cambió su enfoque desde la velocidad de un solo hilo hacia un rendimiento bruto de "fuerza bruta".

3. Rendimiento frente a latencia

El origen de la GPU priorizó el área de silicio para unidades aritméticas simples en lugar de predicción compleja de ramificaciones. Esta filosofía de "ancho y lento" permitió a las GPUs manejar el cálculo repetitivo de triángulos mientras la CPU se enfocaba en lógica no paralela.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

What is the specific 'time budget' required for 60 frames per second (FPS)?

33.33ms

16.67ms

10.00ms

100.00ms

QUESTION 2

How did 3dfx's SLI achieve early parallelism in consumer hardware?

By increasing the clock speed of a single chip.

By having two cards render alternating horizontal scan lines.

By sharing AI logic between the GPU and CPU.

By reducing the resolution of the frame.

QUESTION 3

Why did the GPU diverge from the standard multicore trajectory of CPUs?

GPUs needed deeper caches for complex branching.

GPUs prioritize throughput of simple math over low-latency serial logic.

CPUs became too expensive to manufacture for 3D graphics.

GPU architectures were designed to be smaller than CPUs.

QUESTION 4

In the context of 1990s gaming, what was the 'Real-Time Imperative'?

The requirement to run physics simulations on the GPU.

Processing millions of pixels within the strict frame window.

The transition from 16-bit to 32-bit computing.

Allowing the CPU to handle rasterization.

QUESTION 5

What is meant by the GPU's 'Wide and Slow' philosophy?

Using many simple processors at lower clock speeds to do massive work.

Designing physically wide chips that take longer to process data.

A design that favors high latency but high memory capacity.

Optimizing for single-threaded serial logic.